医疗场景

首页

医疗场景

列表

默认

浏览次数

发布日期

HealthBench

HealthBench是OpenAI推出的开源医疗评估工具，用于衡量大型语言模型在医疗保健领域的表现和安全性。它包含5000个由医生设计的多轮对话，涵盖多种健康场景，并通过多维度评分标准评估模型的准确性、沟通质量等。支持按主题和行为维度进行细分分析，帮助开发者识别模型优势与不足，指导优化方向。适用于模型性能评估、安全测试及医疗AI工具选择。

AI项目与工具 2025年06月11日 79 点赞 0 评论 599 浏览

医疗场景 首页 医疗场景

列表 默认 浏览次数 发布日期

HealthBench

医疗场景

首页

医疗场景

列表

默认

浏览次数

发布日期